前言
在了解深度學習演算法CNN後,今天的文章將要介紹跟CNN相似的RCNN。
概論
RCNN主要用於物體辨識,首先通過selective search選擇1000~2000個候選區域,這些候選區域中有我們所需要對應物體的bounding-box,對於每一個region proposal都用到固定大小的 scale,對於每一個處理過後的圖片,都把它放到CNN模型進行特徵提取,得到每個region proposal的feature map,這些特徵用固定長度的特徵集合feature vector來表示。對於每一個類別,都會得到很多的feature vector,把這些特徵向量直接放到svm分類器去判斷當前region所對應的實物是background還是所對應的物體類別,每個region都會給出所對應的分數,針對這些分數,選出數值較大的分數,再用非極大值抑制(canny NMS)來進行邊緣檢測,最後就會得到所對應的bounding-box。
參考資料
https://medium.com/ai-academy-taiwan/r-cnn%E5%AD%B8%E7%BF%92%E7%AD%86%E8%A8%98-62faf7563d57